Corpus: jpn_newscrawl_2018_1M

Other corpora

2.2.5 Most frequent word beginnings

The most frequent word beginnings as character N-grams for N=1...5 with Zipf's diagram


Zipf's diagram for word beginnings


Gnuplot diagram

Top Characters
word rank frequency n-gram
1 5014 ア-
2 3108 ス-
3 3036 フ-
4 2637 マ-
5 2397 シ-
Top Character Bigrams
word rank frequency n-gram
1 679 ファ-
2 598 イン-
3 561 アン-
4 557 ジャ-
5 546 サン-
Top Character Trigrams
word rank frequency n-gram
1 258 ニュー-
2 245 ドット-
3 187 キム・-
4 153 フォー-
5 151 クリス-
Top Character 4-Grams
word rank frequency n-gram
1 241 ドットコ-
2 127 スーパー-
3 108 スポーツ-
4 105 ニュース-
5 97 スマート-
Top Character 5-Grams
word rank frequency n-gram
1 241 ドットコム-
2 80 ソーシャル-
3 66 オリジナル-
4 62 グローバル-
5 60 アットエス-
2812 msec needed at 2024-05-27 14:01